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基于 区 块 链 技术 的 新 型 分 后 数字 图 书 馅 体系 架构 
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摘要 : [目的 /意义 ] 当 前 数字 图 书馆 系统 数字 资源 可 信 性 、 互 操作 性 及 可 扩展 性 等 成 为 阻碍 数字 图 书馆 发 
展 的 主要 问题 。[ 方 法 /过 程 ] 基 于 区 块 链 技 术 提 出 一 种 新 型 分 层 数 字 图 书馆 体系 架构 ,并 详细 介绍 各 层 的 关键 
功能 组 件 和 核心 服务 模块 ,最 后 与 已 有 相关 数字 图 书馆 体系 架构 进行 综合 比较 。[ 结果 /结论 ] 理 论 分 析 表 明 ， 
所 提 架 构 利 用 区 块 链 技术 的 分 布 式 账本 结构 、 安 全 可 靠 `. 透 明 可 信 、 时 序 不 可 短 改 等 特征 能 有 效 解决 数字 图 书 
馆 数 字 资 源 可 信 性 ,增强 系统 架构 的 互 操作 性 及 可 扩展 性 ,实现 异 构 数 字 资 源 的 安全 流通 。 
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资源 可 信 性 


安全 性 


当今 ,数字 化 、 信 息 化 ,智能 化 等 成 为 社会 演进 方 
后 S2017 年 , 习 总 书记 在 中 共 中 央 政 治 局 第 二 次 集体 
党 司 指 出 ;推动 实施 国家 大 数据 战略 ,加 快 完善 数字 
基础 设施 ,推进 数据 资源 整合 和 开放 共享 ,保障 数据 安 
短 加 快 建设 数字 中 国 "。 数 字 图 书馆 作为 典型 的 数字 
化 信息 系统 ,融合 了 图 书馆 学 ,信息 系统 ,数据 库 管理 、 
多 媒体 、 人 机 交互 等 技术 ”。M.，A，Gongalves 等 “应 
用 GS 模型 , 即 数据 流 (streams) ,组织 结构 (structures) 、 
操作 空间 (spaces) .脚本 ( scenarios) 及 社会 团体 (socie- 
gs, 形式 化 定义 数字 图 书馆 。L，Candela 等 提出 
的 DELOS 参考 模型 从 内 容 ,用户 .功能 .质量 .策略 、 架 
构 等 方面 刻画 数字 图 书馆 。 总 之 ,数字 图 书馆 借鉴 图 
书馆 组 织 模式 来 管理 多 种 类 型 的 数字 化 资源 ,如 文档 、 
图 片 音频、 视频 等 ,利用 计算 机 、 网 络 通讯 等 信息 技术 
突破 时 空 限 制 ,实现 数字 资源 收集 流转、 检索 与 共享 ， 
为 用 户 提供 虚拟 ,高效 和 便捷 的 数字 化 服务 。 

为 满足 海量 异 构 信息 存储 ,检索 及 共享 等 需求 , 数 
字 图 书馆 体系 架构 是 需要 解决 的 基础 性 问题 ,其 决定 
了 数据 图 书馆 底层 基础 设施 ,存储 结构 .通信 协议 及 服 
务 功能 等 。C. B.Arms 等 "提出 数字 图 书馆 体系 由 资 
源 库 .句柄 系统 、 检 索 系 统 及 用 户 接口 组 成 ;张晓林 


等 后 从 数字 内 容 创 建 、 数 字 对 象 描述 .资源 组 织 描述 、 
数字 资源 系统 服务 .数字 资源 长 期 保护 等 方面 构建 数 
字 信 息 资源 建设 的 标准 描述 体系 ; 李 夹 总结 了 数字 
图 书馆 体系 架构 的 设计 原则 , 即 互 操作 性 、 可 扩展 性 、 
规范 性 .层次 化 和 统一 性 ,其 中 互 操作 性 和 可 扩展 性 是 
两 个 需要 关注 的 重点 原则 ; 奉 国 和 总结 了 早期 典型 
的 数字 图 书馆 体系 架构 ,包括 客户 机 /服务 器 两 层 架 
构 ,浏览 器 /Web 服务 器 /数据 库 服 务 器 三 层 架 构 .客户 
机 /服务 器 三 角形 架构 、 分 布 式 体系 架构 等 。 然 而 ,这 
些 体系 架构 都 是 构建 在 传统 基础 设施 上 , 馆 间 互 操作 
性 .可 扩展 性 ` 安 全 性 和 服务 成 本 等 成 为 主要 的 瓶颈 。 
随 着 云 计 算 .服务 计算 等 新 兴 技 术 的 发 展 ,数字 图 书馆 
体系 架构 得 到 进一步 的 发 展 。 现 有 基于 云 计算 或 服务 
计算 数字 图 书馆 体系 架构 研究 中 ,一 部 分 通过 将 异 构 
分 布 式 的 图 书馆 资源 集成 统一 平台 对 外 提供 服务 ,是 
一 种 典型 的 中 心 化 架构 “" ,存在 服务 效率 低 .管理 成 
本 和 风险 较 大 等 问题 ; 另 一 部 分 研究 通过 P2P 技术 构 
建 分 布 式 数字 图 书馆 ,然而 数字 资源 的 可 信 性 依 
赖 于 数字 资源 提供 方 的 信用 背书 ,部 分 依赖 于 云 基 础 
设施 构建 的 数字 图 书馆 难以 防范 数字 资源 伪造 、 算 改 
等 恶意 行为 ,保障 数字 资源 的 可 信 性 。 

据 2017 年 S$，Higgins 报道 ,美国 政府 拨款 10 
万 美元 用 以 研究 区 块 链 在 公共 图 书馆 系统 中 的 应 用 。 
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然而 ,当前 基于 区 块 链 构建 数字 图 书馆 体系 非常 少 。 
2018 年 ,曾子 明和 秦 思 琪 "利用 区 块 链 技术 构建 了 首 
个 面向 智慧 图 书馆 移动 视觉 搜索 的 去 中 心 化 资源 管理 
架构 。 然 而 ,该 架构 并 没有 给 出 适应 数字 图 书馆 具体 
的 区 块 结构 以 及 服务 过 程 ,并 且 对 异 构 资 源 互 操作 性 、 
服务 功能 扩展 性 等 方面 考虑 不 足 。 针 对 上 述 问题 , 笔 
者 基于 区 块 链 技术 构建 一 种 新 型 分 层 数字 图 书馆 体系 
架构 。 一 方面 ,利用 区 块 链 的 分 布 式 结构 、 安 全 可 靠 、 
透明 可 信 、 时 序 不 可 自 改 等 特点 ,克服 数字 图 书馆 数据 
集中 管理 存在 的 单 点 失效 .访问 瓶颈 数据 可 信 等 问 
题 , 保 障 数字 图 书馆 提供 数字 资源 的 可 信人 性 ; 另 一 方面 
通过 自 定义 统一 区 块 存储 结构 ,密码 算法 及 通信 协议 
等 极 大 增强 了 异 构 资源 的 互 操作 性 及 安全 性 ,同时 利 
用 医 块 链 的 动态 性 和 灵活 性 等 提升 数字 图 书馆 系统 的 
可 扩展 性 。 


2 ”相关 工作 


己 当 前 ,由 于 建设 条 件 及 技术 等 因素 使 得 数字 图 书 
馆 依 系 架 构 并 不 统一 。 到 目前 为 止 ,各 国 已 构建 了 多 
种 胡同 类 型 的 数字 图 书馆 体系 ””""” 。1995 年 ,R. 


> 


[ 


KR 和 R，Wilensky' 较 早 提 出 了 数字 图 书馆 体系 K- 


WE 通过 分 离 独立 标识 资源 库 和 句柄 系统 ,并 利用 统一 
的 用 户 界面 实现 同一 体系 下 异 构 数字 资源 的 集中 化 服 
务 会 SPayette 和 C，Lagoze 等 5 提出 灵活 可 扩展 的 数 
芝 千 象 及 资源 库 体系 架构 Fedora ,解决 数字 图 书馆 内 
容 容 储 和 分 发 问题 。 具 体 地 ,Fedora 通过 数字 对 象 模 
型 封装 元 数据 和 数据 内 容 以 及 资源 库 提供 对 外 服务 接 
FjC 队 而 提高 异 构 资 源 互 操作 性 。 针 对 数字 图 书馆 互 
操作 性 问题 ,文献 [16, 19] 总 结 了 常见 的 解决 方法 , 包 
括 标准 化 ,如 TCP/IP 通信 协议 .239. 50 检索 协议 等 ; 
中 间 件 技术 ,如 OAL Dienst 等 ;规范 化 交互 ,如 代理 通 
信 语 言 .高 级 语言 (SETL、PAISLey ) 等 ;移动 功能 规范 ， 
如 Lisp ,Java applets 等 。NDSL、NCSTRL 等 分 布 式 数字 
图 书馆 体系 架构 项 目 正 是 采用 这 些 相 关 技 术 实现 的 。 
2005 年 P，Knezevic 等 ”指出 随 着 面向 服务 架构 
(Services -Oriented Architecture，SOA ) 、P2P 网 络 、 网 格 
计算 等 技术 的 发 展 ,未 来 数字 图 书馆 体系 将 从 集成 .中 
心 化 控制 系统 向 分 布 式 动态 .可 配置 数字 图 书馆 联盟 
服务 方向 演化 。 李 广 建 等 "总结 了 基于 SOA .P2P 和 
网 格 技术 构建 的 数字 图 书馆 体系 架构 。 文 献 [22 -24] 
研究 面向 SOA 的 数字 图 书馆 体系 架构 。 括 红 和 刘 
炜 ”指出 未 来 数字 图 书馆 系统 中 资源 发 现 至 关 重 要 。 
总 体 而 言 , 现 有 的 架构 大 都 侧重 于 提高 系统 互 操作 性 
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和 可 扩展 性 ,然而 数字 资源 的 可 信 性 完全 依赖 于 资源 
提供 方 ,增加 了 数字 资源 信任 建立 成 本 ; 同时 对 数字 资 
源 安 全 性 考虑 不 足 。 


3 区 块 链 技术 基础 


近年 来 ,作为 比特 币 的 底层 支撑 技术 区 块 链 受 到 
国内 外 广泛 关注 ,其 应 用 已 经 从 区 块 链 1.0 数字 货 
区 块 链 2.0 数字 资产 等 延伸 至 数字 社会 等 领域 ”| 。 
笔者 将 区 块 链 引 入 数字 图 书馆 领域 ,构建 一 种 新 型 的 
分 布 式 数字 图 书馆 体系 架构 。 
3.1 区 块 链 概念 

目前 对 区 块 链 并 没有 形成 统一 的 定义 。2015 年 ， 
《经 济 学 人 》 将 区 块 链 描述 为 创造 信任 的 机 器 。2016 
年 ,工信部 发 布 的 白皮书 从 数据 结构 和 数据 处 理 两 个 
角度 定义 区 块 链 ”。 具 体 地 ,从 数据 结构 角度 来 看 ， 
区 块 链 是 一 种 时 序 块 链 式 结构 ,通过 密码 学 保证 分 布 
式 账本 的 不 可 算 改 和 不 可 伪造 ;从 数据 处 理 角 度 来 看 ， 
区 块 链 是 一 种 分 布 式 基础 架构 和 范式 ,利用 块 链 式 结 
构 存 储 数据 、 利 用 共识 算法 来 生成 和 更 新 数据 、 利 用 密 
码 学 来 保证 数据 安全 、 利 用 智能 合约 来 操作 数据 。 总 
体 而 言 ,区 块 链 是 一 种 分 布 式 共 享 总 账 ,融合 了 分 布 式 
账本 技术 .密码 学 .共识 算法 .智能 合约 等 核心 技术 , 保 
障 在 不 需要 可 信 第 三 方 信 用 背书 条 件 下 ,实现 数据 的 
不 易 自 改 .不易 伪造 .可 追溯 和 审计 等 特性 。 
3.2 ”区 块 链 结构 

这 里 简单 介绍 区 块 链 数据 结构 和 存储 结构 。 区 块 
链 是 一 种 时 序 块 链 式 数据 结构 , 见 图 1。 其 中 ,每 个 区 
块 由 区 块头 和 区 块 体 构成 。 不 同 区 块 链 平台 ( 如 比特 
币 区 块 链 、 以 太 坊 区 块 链 等 ) 区 块 结构 是 不 一 样 的 。 中 
国 区 块 链 技术 和 产业 发 展 论坛 上 发 布 的 《区 块 链 数据 
格式 规范 》 标 准 草案 中 给 出 了 区 块 . 事 务 .实体 等 数据 
结构 。 通 常 ,区 块头 存储 上 一 个 区 块 的 哈 希 值 、 
Merkle 根 哈 希 值 .随机 数 等 ,区 块 体 存储 某 段 时 间 内 历 
史 交 易 数据 信息 。 当 前 区 块 的 区 块头 存储 上 一 区 块 的 
双 哈 希 值 形成 时 序 链 式 结构 。Merkle 根 哈 希 能 快速 校 
验 区 块 交易 的 完整 性 ,使 得 在 不 同步 所 有 交易 数据 情 
况 下 可 实现 对 特定 交易 的 验证 , 即 “ 简 单 支 付 验证 ”， 
从 而 提高 区 块 链 运行 效率 和 可 扩展 性 。 区 块 链 存储 结 
构 采 用 键 值 对 形式 ,从 而 方便 了 交易 .区 块 等 数据 检索 
操作 。 存 储 方式 可 以 文件 方式 存储 在 磁盘 ,也 可 以 以 
数据 库 方式 存储 。 当 前 比特 币 区 块 链 中 数据 以 文件 形 
式 存 储 ,索引 数据 存在 LevelDB 中 ;而 以 太 坊 区 块 链 数 
据 和 索引 数据 都 存在 LevelDB 中 。 
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3.3 ”区 块 链 关键 技术 

区 块 链 是 分 布 式 账本 ,密码 学 共识 算法 和 智能 合 
约 等 多 种 技术 综合 。 

(1) 分 布 式 账本 。 不 同类 型 区 块 链 采 用 的 账本 模 
型 是 不 一 样 的 。 目 前 ,常见 的 账本 模型 包括 基于 交易 
的 账本 模型 (如 比特 币 、 量 子 币 等 ) 和 基于 账户 的 账本 
模型 (如 以 太 坊 、 超 级 账本 等 ) 。 

(2) 密码 技术 。 区 块 链 主要 采用 数字 签名 技术 来 
保证 交易 的 完整 性 和 不 可 抵赖 性 等 。 每 个 用 户 拥有 一 
对 公私 钥 对 ,其 中 公 钥 用 来 产生 交易 地 址 , 私 钥 用 来 对 
签名 交易 数据 。 

(3 ) 共 识 算法 。 根 据 参与 主体 准 入 机 制 和 共识 算 
法 的 不 同 ,区 块 链 可 分 为 公有 链 、 联 盟 链 和 私有 链 ,其 
中 联盟 链 和 私有 链 统称 为 许可 链 。 不 同类 型 区 块 链 所 
采用 的 共识 算法 是 不 一 样 的 ,如 比特 币 .以 太 坊 等 公有 
链 因 都 采用 工作 量 证 明 , 具 有 交易 性 能 低 ,资源 开销 大 
8 题 ;超级 账本 联盟 链 采用 实用 拜占庭 容错 ( Pract 
caEByzantine Fault Tolerance, PBFT ) 算法 2 ,可 提供 较 
高 部 易 性 能 和 可 扩展 性 。 
(4) 智 能 合约 。N，Szabo 最 先 提出 智能 合约 ,并 指 
由 戎 是 执行 合约 条 款 的 可 计算 交易 协议 "。2013 年 ， 


VEButerin “将 智能 合约 引入 以 大 坊 ,提出 了 内 置 图 灵 


元 钨 编程 语言 的 去 中 心 化 应 用 平台 ,将 智能 合约 定义 


个 运行 在 安全 环境 下 的 计算 机 程序 ,可 以 直接 控 
数字 资产 。 为 了 防止 智能 合约 漏洞 影响 主机 的 安全 
智能 合约 都 运行 在 具有 隔离 特性 的 沙 箱 环境 。 


区 块 哈 希 信 


kle 根 哈 希 


Merkle 根 哈 希 


区 块 体 
| 数据 块根 哈 希 


区 块 链 的 技术 特性 可 有 效 增强 分 布 式 环境 下 异 构 


数字 资源 的 互 操作 性 和 可 信 性 ,提高 数字 图 书馆 可 扩 
展 性 和 服务 质量 。 基 于 此 ,笔者 基于 区 块 链 技术 设计 
了 一 种 独立 自治 、 分 层 管理 的 新 型 数字 图 书馆 体系 架 
构 ,如 图 2 所 示 : 


应 用 后 
身份 认证 资源 检索 知识 服务 
智能 合约 区 块 链 浏览 各 系统 监控 
共识 层 


PBFT SBFT Raft i 


网 络 层 


| 所 | 


基础 设施 层 


图 2 基于 区 块 链 的 数字 图 书馆 体系 架构 


4.1 基础 设施 层 

基础 设施 层 提 供 构建 数字 图 书馆 体系 架构 的 软 便 
件 设施 ,主要 包括 计算 设备 ,存储 设备 ,网 络 设 备 等 。 
具体 地 ,计算 设备 是 一 组 分 布 式 服务 器 节点 ,提供 区 块 
链 相 关 操作 的 计算 环境 。 存 储 设 备用 来 存储 区 块 数 
据 、 事 务 数据 链 式 结构 合约 代码 、 元 数据 、 数 字 资 源 
及 其 他 数据 等 ,其 中 数字 资源 主要 是 以 文本 、 图 像 、 音 
频 视频 等 表现 形式 的 文献 数据 ,如 电子 期 刊 /会 议论 
文 ,学术 论文 .电子 书 等 ” 。 当 前 常见 的 存储 管理 系统 
有 文件 系统 (如 磁盘 、 移 动 硬盘 等 ) 和 数据 库 系统 (如 
LevelDB .Oceanbase 等 ) 。 网 络 设备 为 区 块 链 节 点 提供 
网 络 通信 环境 ,包括 网 卡 、 交 换 机 、 路 由 器 等 ,实现 区 
块 ` 交 易 .查询 等 数据 传输 。 

目前 ,数字 图 书馆 的 基础 设施 层 可 由 各 单位 投入 
资金 购买 物理 设备 实现 本 地 部 署 。 然 而 ,这 种 方式 带 
来 了 较 高 建设 和 维护 成 本 ,占用 较 多 机 房 空间 ;同时 ， 
系统 弹性 受 限 于 所 购买 的 物理 设备 , 即 物 理 设备 性 能 
过 载 或 元 余 容 易 导 致 服务 质量 下 降 或 资源 浪费 。 另 一 
类 可 通过 租赁 第 三 方 云 平台 搭建 ,常见 的 云 平 台 有 
IBM Bluemix 亚马逊 AWS 等 。 利 用 云 计 算 的 虚拟 化 技 
术 将 分 布 式 、 异 构 的 物理 资源 (包括 计算 、 存 储 、 网 络 等 
设备 ) 抽象 为 资源 池 , 屏 项 底层 物理 资源 设备 的 差异 
性 ,为 上 层 提供 统一 、 透 明 、 按 需 付 费 使 用 的 基础 设施 
即 服 务 ( Infrastructure as a Service, IaaS)。 通 过 IaaS 可 
有 效 整 合 分 布 式 、 异 构 的 物理 资源 ,降低 用 户 部 署 和 维 
护 成 本 ,减少 机 房 占 用 空间 ,提高 系统 资源 利用 率 ; 同 
时 用 户 根 据 业 务 需 求 自 适应 购买 或 释放 所 需 物 理 资 
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源 ,实现 系统 弹性 可 扩展 或 可 伸缩 。 
4.2 数据 层 

为 增强 数字 图 书馆 体系 架构 异 构 资源 互 操作 性 ， 
数据 层 定义 了 数字 图 书馆 统一 资源 存储 结构 和 管理 方 
式 ,主要 包括 区 块 结构 , 链 式 结构 ,交易 结构 及 数字 答 
名 等 。 

当前 ,不 同 应 用 所 构建 的 区 块 链 数据 结构 是 不 一 
样 的 。 共 腾飞 等 "提出 面向 医疗 领域 的 区 块 链 数 据 
共享 模型 ,并 设计 了 由 区 块头 和 区 块 体 组 成 的 医疗 数 
据 存储 结构 ,其 中 区 块 体 存储 医疗 数据 包括 数据 所 有 
者 公 钥 .元 数据 和 数据 摘要 。 为 了 增强 数字 图 书馆 体 
系 异 构 资源 互 操作 性 ,笔者 基于 数字 资源 类 型 和 区 块 
数据 结构 设计 了 一 种 面向 数字 图 书馆 的 统一 数据 结 
攀 s 如 图 3 所 示 : 


上 一 区 块 哈 希 值 随机 数 


6 外 输入 /输出 地 圳 | ”索引 信 || 元 数据 
(6D | 给 入 /输出 地 圳 | 索引 信 || 元 数据 

有 和信/ 壤 也 地 划 | 索引 值 || 元 数据 
和 >| 陋 入 / 策 出 地 志 | ”索引 信 || 元 数据 


文本 哈 希 值 || 数字 

图 像 哈 希 值 | | 数字 签名 
字 
字 


音频 哈 希 值 || 数 
视频 哈 希 值 | | 数 


> ”图 3 数字 图 书馆 统一 的 区 块 数据 结构 


< 所 设计 的 面向 数字 图 书馆 的 统一 数据 结构 由 区 块 
头 出 区 块 休 组 成 ,存储 于 区 块 链 网 络 中 的 每 个 节点 ,其 
中 性 块头 用 以 链接 区 块 .验证 数字 资源 的 完整 性 等 , 即 
在 也 前 区 块头 中 存储 上 一 区 块 哈 希 值 实现 链 式 结构 ; 
区 块 体 用 以 记录 某 段 时 间 内 的 交易 信息 ,主要 包含 数 
字 图 书馆 中 不 同类 型 数字 资源 记录 ,例如 文本 、 图 像 、 
音频 ,视频 等 ,并 生成 Merkle 根 哈 希 写 人 到 区 块头 。 
每 条 数字 资源 记录 由 索引 值 .元 数据 和 数字 资源 哈 希 
值 构成 ,其 中 索引 值 代 表 数 字 资 源 特征 ,用 以 提高 交易 
记录 检索 效率 。 一 般 地 ,可 利用 信息 增益 、 互 信息 、 交 
又 箭 等 函数 提取 数字 资源 特征 。 元 数据 用 来 描述 数据 
资源 属性 , 主要 包括 数据 元 素 、 数 据 格式 、 数 据 交互 
等 2 。 笔 者 采用 诸如 MARC .AACR2 .Dublin core 等 通 
用 标准 表示 异 构 数 字 资 源 ,并 以 HTML 或 XML 等 标记 
语言 显示 ,通过 TCPZIP 、239. 50 等 标准 化 数据 通信 协 
议 交互 元 数据 ,实现 了 对 数字 图 书馆 中 复杂 数字 资源 
统一 表示 ,存储 及 交互 ,从 而 增强 分 布 式 异 构 资源 的 互 
操作 性 ;数字 资源 哈 希 值 一 方面 作为 索引 值 检索 存储 
在 本 地 文件 系统 或 数据 库 系统 中 数字 资源 , 另 一 方面 
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可 用 来 验证 数字 资源 的 完整 性 。 

数字 图 书馆 中 所 有 数字 资源 操作 都 是 通过 区 块 链 
块 链 记录 了 数字 资源 的 交易 信息 ,交易 信息 被 广播 给 
区 块 链 网 络 节点 ,每 隔 一 段 时间 由 其 打包 到 区 块 并 通 
过 共识 层 提供 的 共识 算法 生成 新 区 块 , 然 后 链接 在 原 
来 区 块 链 尾 部 。 交 易 数据 结构 包含 资源 提供 方 地 址 、 
接收 方 地 址 ,索引 值 .元 数据 ,数字 资源 哈 希 值 数字 签 
名 等 信息 。 区 块 链 中 每 个 节点 拥有 一 对 公私 钥 对 ,其 
中 公 钥 用 来 生成 交易 地 址 , 私 钥 用 来 签名 交易 信息 。 
数字 签名 模块 提供 ECDSA 或 RSA 等 签名 算法 完成 对 
每 笔 交 易 信息 的 数字 签名 ,并 通过 公 钥 进行 验证 ,以 保 
障 交易 的 完整 性 和 不 可 否认 性 。 

4.3 网 络 层 

网 络 层 主 要 提供 P2P 组 网 .路 由 机 制 及 验证 机 制 
等 功能 ,实现 数字 图 书馆 区 块 和 交易 等 数据 传输 。 例 
如 ,比特 币 和 以 太 坊 采用 基于 TCP 的 P2P 协议 ,Hy- 
perledger 采用 基于 HTTP/2.0 的 P2P 协议 525 。 数 字 图 
书馆 系统 架构 采用 P2P 网 络 组 织 区 块 链 节点 ,每 个 节 
点 既是 数字 资源 提供 方 ,也 是 使 用 方 。 系 统 中 不 存在 
中 心 化 服务 节点 ,从 而 缓解 了 集中 式 服务 架构 带 来 的 
单 点 失效 .性 能 瓶颈 等 问题 ,提高 了 系统 的 可 扩展 性 。 
当前 ,P2P 组 网 拓扑 可 分 为 结构 化 P2P 网 络 和 非 结构 
化 P2P 网 络 ,其 中 结构 化 P2P 网 络 主要 通过 分 布 式 哈 
和 希 表 来 组 织 网 络 节 点 ,如 Chord .Pastry 等 ; 非 结 构 化 
P2P 网 络 包括 中 心 化 拓扑 (如 Napster) .全 分 布 式 非 结 
构 化 拓扑 (如 Gnutella) ,混合 式 拓扑 (如 KaZaa) 。 

路 由 机 制 提 供 了 节点 发 现 .路 由 选择 .区 块 或 交易 
广播 等 功能 。 节 点 发 现 功能 实现 新 加 入 节点 链接 到 区 
块 链 网 络 中 稳定 节点 。 由 于 P2P 节点 与 地 理 位 置 无 
关 , 因 而 可 以 通过 节点 发 现 功 能 链接 若干 个 节点 接 入 
区 块 链 网 络 , 然 后 由 这 些 节点 链接 其 他 节点 实现 全 网 
互联 ,从 而 可 实现 区 块 或 交易 广播 功能 。 校 验 机 制 用 
来 验证 区 块 或 交易 数据 的 有 效 性 ,避免 无 效 数 据 的 广 
播 浪费 网 络 资源 。 每 个 节点 在 收 到 区 块 或 交易 数据 
后 ,需要 从 数据 结构 .数字 签名 .共识 算法 等 方面 验证 
区 块 或 交易 的 有 效 性 。 若 有 效 , 则 将 区 块 链接 到 原 区 
块 链 尾部 或 将 交易 打包 到 新 区 块 中 ;否则 就 丢弃 该 数 
据 ,阻止 其 继续 传播 。 

4.4 共识 层 

数字 图 书馆 中 数字 资源 操作 以 交易 形式 发 布 到 链 
上 ,由 共识 层 负责 执行 。 共 识 层 通过 用 户 需求 和 数字 
图 书馆 数字 资源 之 间 匹 配 度 达 成 一 致 性 意见 产生 数字 


上 
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图 书馆 新 区 块 ,解决 分 布 式 环境 下 数字 图 书馆 节点 存 
储 数字 资源 的 一 致 性 及 可 信 性 问题 。 当 前 不 同类 型 的 
区 块 链 系统 所 采用 的 共识 算法 是 不 一 样 的 ,主要 可 以 
分 为 :基于 计算 资源 类 共识 和 基于 投票 类 共识 。 由 于 
公有 链 的 自由 性 和 开放 性 ,为 了 抵御 女巫 攻击 ,公有 链 
一 般 采 用 基于 计算 资源 类 的 共识 算法 , 即 通过 节点 计 
算 力 蔡 代 节点 投票 来 竞争 记 账 权 保障 节点 存储 区 块 的 
一 致 性 。 例 如 , 比特 币 采 用 工作 量 证 明 机 制 (Proof of 
Work, PoW) ;以 太 坊 当 前 使 用 PoW ,后 期 计划 切换 到 
权益 证 明 ( Proof of Stake,PoS) 等 。 联 盟 链 提供 节点 管 
理 , 认 证 ,审计 ,控制 等 功能 ,一 般 采 用 基于 投票 类 的 共 
识 算法 ,例如 , Hyperledger 的 实用 拜占庭 容错 PBFT、 
Quorum 的 QuorumChain 共识 。 

本 当前 ,数字 图 书馆 已 形成 多 个 联盟 性 组 织 , 如 中 国 
数字 图 书馆 联盟 (CDLF) ,中 国 高 等 学 校 数字 图 书馆 联 
盟 CSALIS) 及 各 地 方 数 字 图 书馆 联盟 等 。 考 虑 到 公有 
链 性 识 效率 较 低 .计算 开销 大 等 问题 ,笔者 基于 现 有 已 
4 堪 的 数字 图 书馆 联盟 提出 的 基于 区 块 链 数字 图 书馆 
网 架构 采用 基于 投票 类 的 共识 算法 ,如 PBFT SBFT、 
DD 等” ,一 方面 由 于 数字 图 书馆 联盟 成 员 节点 数量 
契 虹 目 固定 ,成 员 间 网 络 连 接 较为 稳定 ,因而 区 块 产生 


和 验证 过 程 只 需要 在 联盟 成 员 节点 间 进 行 ,而 并 不 需 
要 入 网 所 有 节点 参与 ,因此 仅 通 过 联盟 成 员 之 间 进 行 
消息 投票 达到 交易 即 确认 ,而 非 任意 节点 通过 购买 大 
万 许 算 资源 来 实现 概率 性 共识 ,从 而 能 在 保证 成 本 的 
前 提 下 ,减少 区 块 产生 时 间 , 保 障 数字 资源 可 信 性 的 同 
时 极 大 地 提高 交易 效率 。 另 一 方面 数字 图 书馆 联盟 可 
对 贺 块 链 数据 设置 访问 权限 ,一 定 程度 上 保障 了 数字 
资源 安全 。 此 外 ,由 于 数字 图 书馆 新 区 块 产生 是 由 预 
先 选 好 的 节点 决定 ,其 他 节点 只 参与 验证 过 程 ,因而 数 
字 图 书馆 联盟 可 以 不 需要 经 济 激励 机 制 。 

4.5 应 用 层 

应 用 层 为 用 户 提供 数字 图 书馆 分 布 式 应 用 服务 ， 
包括 区 块 链 服务 及 用 户 服务 。 

区 块 链 服务 主要 包括 智能 合约 、 区 块 链 浏览 器 及 
系统 监控 等 。 〇 智能 合约 服务 通过 将 数字 图 书馆 中 业 
务 逻辑 数字 化 ,程序 化 、 自 动 化 等 ,一 方面 简化 了 诸如 
文献 传递 .资源 导航 、 信 息 推送 等 数字 图 书馆 服务 流 


户 可 通过 Solidity.C + + Java 等 编程 语言 定制 满足 需 
求 的 智能 合约 ,并 通过 接口 部 署 到 区 块 链 上 ,保障 数字 
资源 的 可 信 性 ,同时 实现 数字 图 书馆 的 个 性 化 服务 。 
@ 区 块 链 浏览 器 以 Web 形式 提供 区 块 及 交易 信息 查 
询 及 浏览 功能 。 用 户 可 根据 区 块 哈 希 值 交易 喻 希 值 、 
区 块 高 度 、 交 易 地 址 等 信息 查询 。 例 如 ,用 户 可 通过 区 
块 哈 希 值 或 区 块 高 度 等 查询 到 区 块 数据 ,包括 区 块头 
和 区 块 体 ,具体 数据 结构 见 数据 层 ;通过 交易 哈 希 值 查 
询 某 笔 交 易 具 体 信息 ,包括 交易 双方 地 址 、 索 引 值 .元 
数据 数字 资源 哈 希 值 .数字 签名 、 确 认 数 等 信息 。 浏 
览 功 能 主要 查看 最 近 的 数字 资源 交易 记录 、 每 日 交易 
量 ,交易 吞吐 量 ,交易 速率 等 信息 。 久 系统 监控 主要 以 
可 视 化 形式 实时 显示 系统 资源 耗费 及 负载 情况 ,包括 
CPU 使 用 率 .进程 数 ,内存 利用 率 等 信息 。 

用 户 服务 主要 包括 身份 认证 ,资源 检索 和 知识 服 
务 等 。 中 身份 认证 提供 用 户 注 册 、 登 录 、 注 销 等 功能 。 
只 有 通过 身份 认证 的 合法 用 户 才 被 允许 进入 基于 区 块 
链 的 数字 图 书馆 联盟 链 网 络 ,并 根据 所 授权 的 权限 进 
行 数字 图 书馆 联盟 链 上 的 相关 操作 。 当 前 数字 图 书馆 
联盟 链 认证 可 采用 口令 认证 、 公 钥 证 书 认证 .生物 特征 
认证 等 方式 。 包 资源 检索 是 通过 区 块 链 交 易 实 现 ,是 
数字 图 书馆 提供 的 主要 服务 。 笔 者 首先 采用 TF -IDF 
方法 ”提取 用 户 查 询 内 容 的 特征 值 ,并 将 请 求 以 区 块 
链 交 易 形式 提交 给 数字 图 书馆 联盟 链 。 然 后 ,联盟 链 
节点 通过 计算 区 块 体 中 索引 值 与 特征 值 之 间 的 相似 关 
系 , 通 过 阔 值 法 或 top-n 策略 找到 满足 要 求 的 交易 记 
录 , 即 相似 关系 高 于 所 定义 的 浆 值 或 者 相似 关系 排 在 
前 n 即 满足 要 求 。 最 后 ,根据 交易 记录 中 的 数字 资源 
哈 希 值 查 找 本 地 文件 系统 或 数据 库 得 到 所 需 数字 资源 
并 返回 给 用 户 。@@ 知 识 服务 提供 产权 保护 .数据 审计 
与 分 析 等 数字 图 书馆 服务 。 知 识 产 权 可 通过 数字 签名 
实现 ,数据 审计 与 分 析 可 利用 大 数据 技术 完成 。 

4.6 管理 层 

管理 层 负责 维护 基于 区 块 链 的 数字 图 书馆 体系 架 
构 , 包 括 身份 管理 .访问 管理 、 密 钥 管 理 .接口 管 理 、 负 
载 管理 等 。 中 身份 管理 一 方面 负责 数字 图 书馆 联盟 成 
员 数 字 身 份 的 增加 、 更 新 、 删 除 等 操作 ,实现 数字 图 书 
馆 联盟 链 中 节点 的 动态 加 入 和 退出 ;其 中 数字 身份 是 


程 ,降低 中 间 环 厄 数字 资源 盗 镭 和 欺诈 的 风险 ,提高 数 
字 资 源 可 信 性 及 服务 效率 ,减少 信用 背书 及 服务 成 本 。 
例如 ,通过 智能 合约 可 实现 无 人 值守 和 干预 的 数字 图 
书馆 文献 传递 ,从 而 提高 数字 资源 流转 自动 化 和 智能 
化 。 男 一 方面 提供 灵活 、 可 编程 的 数字 图 书馆 功能 ,用 


日 以 证 明 自 身 合 法 性 的 信息 或 属性 ,具有 唯一 性 稳定 
性 等 特点 ,如 身份 标识 (身份 证 .邮箱 等 ) .生物 特征 
(指纹 .虹膜 等 ) 。 另 一 方面 负责 身份 保密 和 鉴别 , 解 
决 身份 泄露 和 伪造 等 攻击 ,提供 管理 身份 的 安全 性 和 
隐私 性 ” 。 当 前 身份 保密 一 般 采用 加 密 技术 、 匿 名 技 


| 


61 


图 二 情报 三 作 


第 62 卷 第 24 期 2018 年 12 月 


nm”YVi 人 人 人生 甘 日 王 || 
C| InaxIV 瑟 个 F 只 有 站 


术 .差分 隐私 等 实现 ;身份 鉴别 可 采用 不 同类 型 身份 认 
证 技术 实现 。 加 访问 管理 一 方面 规定 了 数字 图 书馆 联 
盟 链 中 合法 节点 对 数字 资源 的 访问 权限 和 策略 。 访 问 
权限 可 由 访问 控制 矩阵 ,访问 控制 列表 能力 关系 表 等 
建 模 。 基 本 的 访问 控制 策略 有 自主 访问 控制 ,强制 访 
间 控 制 .角色 访问 控制 等 。 考 虑 到 数字 图 书馆 中 数字 
资源 安全 需求 的 差异 性 ,笔者 引入 等 级 保护 技术 实现 
对 数字 图 书馆 数字 资源 的 分 级 保护 。@ 密 钥 管 理 负责 
管理 数字 图 书馆 联盟 链 中 每 个 节点 的 公私 钥 对 ,可 采 
用 分 层 钱包 实现 。@ 搂 口 管理 一 方面 为 分 层 数字 图 书 
馆 体系 提供 层 与 层 之 间 调 用 的 接口 函数 ; 另 一 方面 提 
供 了 外 部 系统 访问 智能 合约 服务 ,数字 图 书馆 联盟 链 
平台 及 数据 接口 。@@ 和 负载 管 理 主要 根据 当前 各 个 节点 
资源 使 用 率 进行 任务 调度 ,优化 区 块 链 节点 性 能 ,为 共 
识 斌 成 ,智能 合约 执行 等 过 程 的 高 效 性 提供 资源 保障 ， 
提高 数字 图 书馆 资源 存储 和 检索 性 能 。 


一 本 节 将 从 体系 架构 . 互 操作 性 可 扩展 性 .安全 性 、 


式 叶 六 云 计算 体系 "中 点 对 点 体系 "中 等 。SOA 
数学 图 书馆 体系 架构 “和 云 计算 数字 图 书馆 体 


用 乓 ”都 是 将 数字 资源 整合 在 一 起 对 外 提供 统一 服 
务 。 生 有 较 好 的 互 操作 性 和 可 扩展 性 。 然 而 这 些 逻 辑 
上 都 是 一 种 中 心 化 架构 ,存在 服务 性 能 瓶颈 , 单 点 失 
效 ( 训 全 风险 较 大 等 问题 ;点 对 点 数字 图 书馆 架 
构 "" "通过 分 布 式 方式 管理 数字 化 资源 并 对 外 提供 
服务 ,具有 较 好 的 互 操作 性 和 可 扩展 性 。 然 而 ,这 三 类 
架构 中 数字 资源 的 可 信 性 完全 依赖 于 数字 资源 提供 者 
的 信用 背书 ,增加 了 数字 资源 信任 建立 成 本 ;同时 没有 
考虑 数字 图 书馆 中 数字 资源 的 安全 性 。 例 如 , 云 计算 
数字 图 书馆 构建 在 云端 使 得 数字 资源 所 有 权 和 管理 权 
相 分 离 , 从 而 极 大 威胁 数字 资源 的 安全 性 。 文 献 [14] 
利用 区 块 链 技术 构建 了 首 个 面向 智慧 图 书馆 移动 视觉 
搜索 的 去 中 心 化 资源 管理 架构 。 然 而 ,该 架构 并 没有 
给 出 适应 数字 图 书馆 具体 的 区 块 结构 以 及 服务 过 程 ， 
并 且 对 异 构 资源 互 操作 性 、 服 务 功能 扩展 性 等 方面 考 
虑 不 足 。 相 比 现 有 这 些 数 字 图 书馆 体系 架构 ,在 数字 
资源 可 信 性 方面 ,本 架构 利用 区 块 链 的 分 布 式 账本 、 密 
码 学 ,共识 算法 等 关键 技术 保障 了 所 构建 的 数字 图 书 
馆 体系 架构 能 在 不 依赖 于 第 三 方 机 构 信任 背书 情况 下 
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保证 数字 资源 的 可 信 性 。 在 互 操 作 性 方面 ,本 架构 通 
过 自 定义 面向 数字 图 书馆 统一 数据 结构 ,包括 区 块 存 
储 结构 交易 结构 等 ,屏蔽 了 不 同 数字 图 书馆 中 数字 资 
源 存储 形式 的 差异 性 ,以 及 密码 算法 和 通信 协议 ,从 而 
有 效 增强 了 不 同 数字 图 书馆 中 数字 资源 的 互 操作 性 。 
在 可 扩展 性 方面 ,本 架构 利用 云 计 算 技术 提供 Iaas 实 
现 了 系统 弹性 可 扩展 ;同时 采用 联盟 链 的 部 署 形 式 增 
强 了 数字 图 书馆 节点 的 动态 性 和 可 扩展 性 ,加 快 了 共 
识 达成 效率 ;此 外 根据 节点 资源 使 用 率 进行 有 效 负载 
管理 ,优化 区 块 链 节 点 性 能 ,保障 了 数字 资源 可 信和 性 的 
同时 提高 了 数字 资源 的 获取 效率 。 

然而 ,由 于 区 块 链 技 术 本 身 仍然 不 完善 ,限于 篇 幅 
受 限 ,所 提出 的 基于 区 块 链 的 数字 图 书馆 体系 架构 未 
来 将 研究 :中 所 构建 的 数字 图 书馆 联盟 链 是 动态 增长 、 
不 可 算 改 的 , 随 着 交易 数据 的 增加 ,区 块 体积 膨胀 及 性 
能 问题 会 越 来 越 突出 。 现 有 研究 提出 了 一 些 解决 方 
案 , 例 如 利用 隔离 见证 扩大 区 块 容量 ,优化 数据 结构 ; 
通过 分 片 技术 、 闪 电 或 雷电 网 络 等 进一步 增加 系统 性 
能 。 书 交易 数据 由 联盟 图 书馆 共同 维护 ,然而 不 同 数 
字 图 书馆 对 数字 资源 的 隐私 需求 不 同 ,为 保障 数字 资 
源 隐私 性 ,对 节点 访问 、 查 询 等 进行 有 效 管理 仍然 需要 
进一步 研究 。@®) 结 合 所 提出 的 基于 区 块 链 的 数字 图 书 
馆 体 系 架构 ,开发 与 现 有 数字 图 书馆 相 兼 容 的 应 用 系 
统 ,推动 落地 实践 是 下 一 步 需要 开展 工作 。 

表 1 数字 图 书馆 体系 架构 比较 


OO 
文献 [22 -24] SOA 数字 图 书馆 架构 V VvV x x 
文献 [8 -10] 云 计 算数 字 图 书馆 架构 VV VvV x x 
文献 [11 -12] 点 对 点 数字 图 书馆 架构 VV VvV x x 

文献 [14] 去 中 心 移动 搜索 架构 x x VvV V 
本 架构 区 块 链 数字 图 书馆 架构 VvV VvV VvV VV 
6 总 结 


针对 当前 数字 图 书馆 体系 架构 难以 防范 数字 资源 
伪造 、 算 改 等 恶意 行为 ,笔者 提出 了 一 种 基于 区 块 链 技 
术 的 数字 图 书馆 体系 架构 ,解决 了 数字 资源 可 信 性 问 
题 , 降 低 了 数字 资源 信任 构建 成 本 。 相 比 于 现 有 数字 
图 书馆 体系 架构 ,该 架构 通过 自 定义 统一 区 块 存储 结 
构 标准 化 密码 算法 及 通信 协议 等 增强 了 异 构 资 源 的 
互 操 作 性 及 安全 性 ,同时 系统 基础 设施 、 区 块 链 部 署 形 
式 及 服务 负载 优化 等 提升 了 数字 图 书馆 系统 可 扩展 
性 。 未 来 将 围绕 数字 图 书馆 联盟 链 区 块 体积 膨胀 ,性 
能 优化 .数字 资源 隐私 保护 等 方面 研究 ,进一步 推动 所 
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A Novel Hierarchical Digital Library System Architecture Based on Blockchain Technology 
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Abstract. [ Purpose/significance | At present, the digital resource problems of trust, interoperability and scalability 
in digital library system have become the major obstacle for the development of digital library. [ Method/process| Based 
on the blockchain technology, we proposed a novel hierarchical digital library system architecture. Then, we described the 
key functional components and core service modules of each layer in detail. Finally, we compared our proposed digital li- 
brary system architecture with the others. [ Result/conclusion | Theoretical analysis proves that our proposed digital li- 
brary system architecture exploits the features of blockchain such as distributed ledger architecture, security and reliable ， 
transparent and credible, time-series and tamper-resistant, can solve the trust problem of digital resource, enhance the in- 
teroPerability and scalability and achieve the security flow of heterogeneous digital resource. 
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: 考 、 借 鉴 或 指导 作用 。 
: 3. 所 有 来 稿 均 须 经 过 论文 的 相似 度 检 测 ,提交 同行 专家 评议 ,并 经 过 编辑 部 的 初审 .复审 和 终审 
: 4. 文章 篇 幅 不 限 , 但 一 般 以 4 000 -20 000 字 为 宜 。 
1 
1 
1 
1 
i 


和 
| | V .4 
汪 
二 
江 
融 
Hd 


S 


o 


5. 来稿 将 在 1 个 月 内 告知 录用 与 否 。 

6. 稿件 主要 通过 网 络 发 表 , 如 我 刊 的 网 站 (www. kmf. ac. en) 和 我 刊 授 权 的 数据 库 。 同 时 ,实行 开放 获取 、 按 篇 
出 版 和 按 需 印刷 。 

请 登录 www. kmf. ac. cn 投稿 。 


联系 电话 :010 - 82626611 -6638 联系 人 : 刘 远 颖 


64 


